Программирование массово параллельных процессоров: Практический подход: Эволюционный сдвиг к архитектуре общего назначения для видеопроцессоров

Переход от NVIDIA GT200 к архитектуре Fermi означает рождение третьего поколения вычислений на видеопроцессорах. В то время как предыдущие архитектуры были первоначально ориентированы на графику и «подгонялись» под математические задачи, архитектура Fermi была создана с нуля для GPGPU (видеопроцессор общего назначения) приложений.

1. От графики к вычислениям

В отличие от GT200, который был ориентирован на текстурные блоки и жесткую параллельную обработку данных, архитектура Fermi ввела единый путь запроса к памяти. Этот сдвиг позволил реализовать компьютерное мышление, что дало разработчикам возможность перейти от простых двумерных сеток к сложным алгоритмам на языке С++.

2. Прорыв в иерархии памяти

Архитектура Fermi ввела настоящую иерархию кэш-памяти L1/L2 и соответствие стандарту IEEE 754-2008 плавающей точки. Это означало, что исследователям больше не нужно было вручную управлять «рабочей памятью» (общей памятью) для каждого байта, что позволило использовать неправильные структуры данных и точность двойной точности, необходимую для научно-инженерных расчетов.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which architecture is considered the true start of the 'Third Generation' of GPU computing?

GT200 (Tesla)

Fermi

G80

Fixed-function Pipeline

QUESTION 2

What memory feature was introduced in Fermi to help handle irregular data patterns?

Manual Scratchpad only

Hardware-managed L1/L2 Cache Hierarchy

Write-only Texture Buffers

Disabling Global Memory

QUESTION 3

Fermi's compliance with IEEE 754-2008 was critical for which application type?

Simple 2D Sprite Rendering

High-precision Scientific Computing (FP64)

Text Scrolling

Basic Vertex Shading

QUESTION 4

What does 'Computational Thinking' refer to in the context of the Fermi shift?

Treating the GPU as a fixed-function signal processor.

Focusing on the physics of the problem rather than manual data movement.

Manually coding assembly for every pixel.

Using only 2D textures for storage.

QUESTION 5

How did Fermi improve thread management?

It removed the concept of Warps.

It introduced sophisticated hardware thread scheduling.

It limited threads to only 32 per GPU.

It forced all threads to run the same instruction forever.